Статья 7116

Название статьи

АЛГОРИТМ ПОСТРОЕНИЯ ЗВУКОВОГО ФРАГМЕНТАТОРА РЕЧИ ДЛЯ РАСПОЗНАВАНИЯ ГОЛОСОВЫХ ОБРАЗОВ С УЧЕТОМ БИОМЕТРИЧЕСКИХ ОСОБЕННОСТЕЙ ДИКТОРА

Авторы

Бойков Илья Владимирович, доктор физико-математических наук, профессор, заведующий кафедрой высшей и прикладной математики, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), boikov@pnzgu.ru
Калашников Дмитрий Михайлович, аспирант, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), kalashnikovdm.penza@gmail.com

Индекс УДК

004; 519.7; 519.6; 519.66; 612.087.1

Аннотация

Актуальность и цели. В последнее время остро стоит вопрос об обеспечении информационной безопасности. Голосовая идентификация личности пока не вошла в обиход из-за ряда нерешенных проблем. Одной из важнейших проблем является достоверность аутентификации. В настоящее время вероятность ошибки распознавания диктора по голосу достаточно высока. Требуются алгоритмы для более четкого выявления биометрических параметров диктора из голосового сигнала. Второй проблемой является нестабильная работа аппаратуры в условиях шума. Третью проблему составляет многообразие проявлений голоса одного человека: голос способен изменяться в зависимости от состояния здоровья, возраста, настроения и т.д. В работе предлагаются методы и алгоритмы, направленные на решение данных проблем.
Материалы и методы. В работе использованы численные методы обработки непрерывной и дискретной информации, методы гармонического анализа, спектральные методы, методы математической статистики и временных рядов. В основу построения фрагментатора положена континуально-дискретная модель обработки речи, которая в сочетании с узкополосным фильтром позволяет определять среднюю длину звука. Использована линейная предобработка данных голосового сигнала для уточнения периода основного тона.
Результаты. В работе предложен метод идентификации личности диктора по результатам анализа фрагментов речи. Предложен новый метод фрагментации речи в целом и отдельных фраз. Внедрение данного метода кластеризации звуковых файлов в систему голосовой аутентификации личности человека позволило снизить вероятность ошибки второго рода (т.е. опознание постороннего человека как своего) до 10−3 при парольной фразе, содержащей три слова. Построен автомат по выделению и классификации звуковых фрагментов слитной речи.
Выводы. Предложен численный алгоритм идентификации речи отдельного диктора, позволяющий производить синхронизацию участков речи. Использование статистического метода позволило уточнять значение выявленных параметров. Проведенное исследование позволило построить автомат по выделению и классификации звуковых фрагментов на различных участках звукового сигнала. Данная процедура была интегрирована в состав имеющейся системы голосовой аутентификации и значительно улучшила качество работы системы при появлении вероятности ошибки второго рода.

Ключевые слова

цифровая обработка сигналов, численные методы, биометрия, предсказание речи, голосовая аутентификация, синхронизация звуковых фрагментов речи

 

 Скачать статью в формате PDF

Список литературы

1. Агашин, О. С. Методы цифровой обработки речевого сигнала в задаче распознавания изолированных слов с применением сигнальных процессоров / О. С. Агашин, О. Н. Корелин // Труды нижегородского государственного технического университета им. Р. Е. Алексеева. – 2012. – № 4 (97). – С. 32–44.
2. Хургин, Я. И. Финитные функции в физике и технике / Я. И. Хургин, В. П. Яковлев. – М. : Наука, 1971. – 408 с.
3. Stenger, F. Numerical Methods Based on Sinc and Analytic Functions / F. Stenger // Springer Series in Computational Mathematics. – Springer Verlag, 1993. – 565 р.
4. Dodis, Y. A. Fuzzy Extractors: How to Generate Strong Keys from Biometrics and Other Noisy / Y. Dodis, L. Reyzin // EUROCRYPT. – 2004, April 13. – P. 523–540.
5. Monrose, F. Cryptographic key generation from voice / F. Monrose, M. Reiter, Q. Li, S. Wetzel // Proc. IEEE Symp.on Security and Privacy, 2001. – P. 1–12.
6. Бойков, И. В. Алгоритм построения статистического дискретно-континуального описания длительности звуков потока осмысленной речи диктора / И. В. Бойков, А. И. Иванов, Д. М. Калашников // Известия высших учебных заведений. Поволжский регион. Технические науки. – 2015. –№ 4 (36). – С. 64–78.
7. Язов, Ю. К. Нейросетевая защита персональных биометрических данных / Ю. К. Язов, В. И. Волчихин, А. И. Иванов, В. А. Фунтиков, И. Г. Назаров ; под ред. Ю. К. Язова. – М. : Радиотехника, 2012. – 157 с.
8. Технология использования больших нейронных сетей для преобразования нечетких биометрических данных в код ключа доступа : моногр. / Б. С. Ахметов, А. И. Иванов, В. А. Фунтиков, А. В. Безяев, Е. А. Малыгина. – Алматы, Казахстан :LEM, 2014. –144 c. – URL: http://portal.kazntu.kz/files/publicate/2014-06-27-11940.pdf

 

Дата создания: 25.05.2016 15:19
Дата обновления: 30.06.2016 15:38